“The goal is to turn data into information, and information into insight” Carly Fiorina, CEO de HP desde 1999 hasta 2005
if(!require("pacman")) install.packages("pacman")## Loading required package: pacman
p_load("tidyverse", "maps", "lubridate", "plotly")Usted en la Tarea 1 (pregunta 1.5) tuvo que identificar el porcentaje de películas estrenadas por década. A partir del data frame obtenido, construya un pie chart usando la librería plotly. (20 puntos)
movie_dataset <- read.csv("Datasets/movie_dataset.csv")
# porcentaje de peliculas por decada
decade_movies <- movie_dataset %>%
na.omit() %>%
mutate(year = year(release_date), decade = year - year%%10, n = n()) %>%
group_by(decade, n) %>%
summarise(n()) %>%
mutate(percentage = `n()`/n)p <- plot_ly(decade_movies, labels = ~ decade, values = ~percentage, type = "pie") %>%
layout(title = "Porcentaje de películas por década",
xaxis = list(showgrid = FALSE, zeroline = FALSE, showticklabels = FALSE),
yaxis = list(showgrid = FALSE, zeroline = FALSE, showticklabels = FALSE))
pConsiderando la Tarea 1 (pregunta 1.6), indentifique el presupuesto promedio (budget) por estado y presentelo esta vez utilizando el mapa de los Estados Unidos. (20 puntos)
# cargamos la lista y la transformas a character
lista_estados <- read.csv("Datasets/estados.csv") %>%
as.matrix() %>%
as.character()# Promedio de presupuesto por estado de Estados Unidos
keywords <- read.csv("Datasets/keywords.csv")
peliculas_estado <- keywords %>%
filter(keywords %in% lista_estados) %>%
right_join(movie_dataset, by = "id") %>%
group_by(keywords) %>%
summarise(count=n(), mean(budget)) %>%
mutate(nombre_estado=keywords) %>%
right_join(
tibble(nombre_estado=lista_estados),
by="nombre_estado"
) %>%
select(nombre_estado, count, `mean(budget)`) %>%
mutate(
count=ifelse(is.na(count),0,count)
) %>%
rename("presupuesto" = `mean(budget)`) %>%
arrange(desc(count)) ## Warning: Column `nombre_estado` joining factor and character vector,
## coercing into character vector
mapa_estados <- map_data("state") g1 <- ggplot(peliculas_estado) +
geom_map(aes(map_id = nombre_estado, fill = presupuesto), map = mapa_estados) +
expand_limits(x = mapa_estados$long, y = mapa_estados$lat) +
labs(title ="Presupuesto promedio por Estados", subtitle = "Estados Unidos") + xlab("Longitud") + ylab("Latitud") +
theme_bw()
g1A partir de las variables seleccionadas del World Development Indicators de su Tarea 2, represente en un mapa los valores que asume cada variable en 1990 y 2015.
Visite el sitio web http://datos.gob.cl/ y descargue una base de datos de su preferencia1, justificando su elección. Luego, represente los datos seleccionados en un mapa de una o varias de las comunas de la región Metropolitana. Los mapas vectoriales pueden ser descargados de https://www.bcn.cl.
Debe contener las comunas de la región Metropolitana.↩